html-parsing

html-parsing

文章 0 浏览 6

在 Rails 中创建 HTML 段落的文本摘录

我正在尝试提取一篇文章的摘录(标记解析为 HTML),其中仅包含段落中的纯文本。所有 HTML 都需要被删除,换行符、制表符和连续空格需要替换为单个空…

月朦胧 2025-01-12 02:29:24 0 0

在bash Linux中获取count的值

我有如下字符串, || name: xzy || class: 9 || date: 07-01-2022 || marks:25 我只想检索标记 Ie 25 。所有字符串值都不断变化。名称、日期和标记是…

送君千里 2025-01-10 19:28:21 1 0

抓取数据时找不到标签

我是 Python 新手,一直在开发一个程序,该程序会在新商品上传到 jp.mercari.com(购物网站)时提醒您。我的程序的警报部分正在运行,但它是根据搜索…

垂暮老矣 2025-01-10 16:48:21 1 0

无法在 python 上使用 selenium 访问类中的文本

我愿意解析 https://2gis.kz ,并且我遇到了使用时出错的问题。文本或用于从类中提取文本的任何方法 我正在输入搜索查询,例如“健身” 我的窗口变量…

不必你懂 2025-01-09 13:28:04 1 0

如何从文章网页中确定文章PDF下载链接?

我想从我的 DOI 列表中自动下载一些文章(大约 1500 篇)。使用 doi.org 我可以获得每个人的网站内容。但问题是每个网站都是独一无二的,我不知道如何…

玩套路吗 2025-01-09 13:24:31 1 0

Python - 如何通过多个Google网站搜索电子邮件地址

我正在尝试检索在网络上搜索的不同公司的一些电子邮件地址。 我有一个包含公司名称的 Excel 文件,我想出了一个小脚本,可以 在 Google 上并排搜索每…

染年凉城似染瑾 2025-01-09 02:12:39 2 0

如何使用 Jsoup 获取此文本?

如何使用 Jsoup 从以下 html 代码中获取“此文本”? this text Other texts00:00 当我尝试 String s = doc…

比忠 2025-01-08 17:13:20 1 0

如何删除字符串中 HTML 标记中的所有 HTML 属性

我试图获取一个包含 HTML 的字符串,去掉一些标签(img、object)和所有其他 HTML 标签,去掉它们的属性。例如: Some Text Some Link Text 会变成: …

输什么也不输骨气 2025-01-08 06:27:05 1 0

尝试创建一个正则表达式来从java中的字符串中提取网站地址,但无法正确执行

我正在尝试使用以下代码从 url 中提取网站地址, public String getWebSiteAddress(String text) { Pattern p = Pattern.compile("\\b([a-z0-9]+(-[a-…

永不分离 2025-01-08 02:33:40 2 0

使用 PHP 的 DOM 实现返回第一个“n”; HTML 字符串的字符

给定一个 HTML 字符串,我想返回具有以下属性的修改后的字符串: 文本内容的前 n 个字符(除了 HTML 标签)应保留。 满足 n 个字符之后的元素应完全删…

清引 2025-01-07 13:28:12 1 0

如何找到

我在 Java 中使用 Xerces。我想解析 HTML 文档以查找具有特定属性(例如 id = myID)的 div 元素。找到所述元素后,我想返回 div 中的文本内容。我无…

三岁铭 2025-01-07 07:22:21 1 0

HTML 图像字符串解析器

我想知道是否有人对我的问题有任何想法。我需要从 UIWebView 加载的 html 文件中提取所有图像文件。我已将文件加载到 NSString 中,现在需要解析该文…

聊慰 2025-01-07 04:09:38 1 0

lxml 和 libxml2 哪个更适合在 Python 中解析格式错误的 html?

对于格式错误的 html,哪一个更好、更有用? 我找不到如何使用 libxml2。 谢谢。…

樱娆 2025-01-07 01:24:27 1 0

从 HTML 页面创建 CSV 文件

我从数据库中提取了记录并将它们存储在仅包含文本的 HTML 页面上。每条记录都存储在 段落字段中,并由换行符 和行 hr>. 例如: Company Name 555-555-…

别闹i 2025-01-06 23:28:18 1 0

JavaScript 中严格的 HTML 解析

在 Google Chrome (Canary) 上,似乎没有字符串可以使 DOM 解析器失败。我正在尝试解析一些 HTML,但如果 HTML 不完全、100% 有效,我希望它显示错误…

ζ澈沫 2025-01-06 18:10:07 1 0
更多

推荐作者

卷耳

文章 0 评论 0

佚名

文章 0 评论 0

℉服软

文章 0 评论 0

qq_2gSKZM

文章 0 评论 0

凉宸

文章 0 评论 0

gyhjy

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文